Например, Бобцов

Автоматическое определение типа аллергии из неструктурированных медицинских текстов на русском языке

Аннотация:

Большая часть медицинских данных в базах медицинских информационных систем хранится в неструктурированном виде. Методы обработки неструктурированных записей широко представлены в литературе для английского языка. В работе предложен метод интеллектуального анализа неструктурированных аллергологических анамнезов на русском языке с целью определения наличия и типа аллергии и непереносимости у пациента. В основе метода лежат алгоритмы машинного обучения, а также используются международные стандарты обмена медицинскими данными, такие как FHIR и SNOMED CT. В результате эксперимента обработано около 12 тысяч медицинских записей. Значение F-меры для разработанных моделей классификации составило от 0,93 до 0,96. Полученные модели показали высокие значения метрик оценки эффективности моделей. В дальнейшем структурированные данные могут быть использованы в моделях предсказания медицинских рисков. Развитие методов структурирования медицинских текстов обеспечит интероперабельность медицинских данных.

Ключевые слова:

Статьи в номере